keywords:"Apache Hadoop" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"Apache Hadoop"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Computational tasks for Parallel data processing course Horečný, Peter ; Rajnoha, Martin (oponent) ; Mašek, Jan (vedoucí práce) The goal of this thesis was to create laboratory excercises for subject „Parallel data processing“, which will introduce options and capabilities of Apache Spark technology to the students. The excercises focus on work with basic operations and data preprocessing, work with concepts and algorithms of machine learning. By following the instructions, the students will solve real world situations problems by using algorithms for linear regression, classification, clustering and frequent patterns. This will show them the real usage and advantages of Spark. As an input data, there will be databases of czech and slovak companies with a lot of information provided, which need to be prepared, filtered and sorted for next processing in the first excercise. The students will also get known with functional programming, because the are not whole programs in excercises, but just the pieces of instructions, which are not repeated in the following excercises. They will get a comprehensive overview about possibilities of Spark by getting over all the excercices. Úplný záznam
	BigData řešení pro zpracování rozsáhlých dat ze síťových toků Melkes, Miloslav ; Ráb, Jaroslav (oponent) ; Ryšavý, Ondřej (vedoucí práce) Tato diplomová práce se zaměřuje na problematiku distribuovaného zpracování velkých dat ze síťové komunikace. Začíná analýzou síťové komunikace založené na modelu TCP/IP se zaměřením na datové jednotky na jednotlivých vrstvách, které je nutno při analýze síťových dat zpracovávat. Z hlediska vlastního zpracování rozsáhlých dat je objasněn výpočetní model MapReduce, architektura technologie Apache Hadoop a jejich možné využití pro zpracování síťových toků na clusteru počítačů. Druhá část práce se zbývá návrhem a následnou implementací aplikace pro zpracování síťových toků ze zachycené síťové komunikace. V této části jsou rozebrány klíčové a problematické části z implementace. Celá práce je poté zakončena srovnáním s dostupnými nástroji pro síťovou analýzu a vyhodnocením sady testů, které potvrdili lineární růst zrychlení. Úplný záznam
	Computational tasks for Parallel data processing course Horečný, Peter ; Rajnoha, Martin (oponent) ; Mašek, Jan (vedoucí práce) The goal of this thesis was to create laboratory excercises for subject „Parallel data processing“, which will introduce options and capabilities of Apache Spark technology to the students. The excercises focus on work with basic operations and data preprocessing, work with concepts and algorithms of machine learning. By following the instructions, the students will solve real world situations problems by using algorithms for linear regression, classification, clustering and frequent patterns. This will show them the real usage and advantages of Spark. As an input data, there will be databases of czech and slovak companies with a lot of information provided, which need to be prepared, filtered and sorted for next processing in the first excercise. The students will also get known with functional programming, because the are not whole programs in excercises, but just the pieces of instructions, which are not repeated in the following excercises. They will get a comprehensive overview about possibilities of Spark by getting over all the excercices. Úplný záznam
	Gradient Boosting Machine and Artificial Neural Networks in R and H2O Sabo, Juraj ; Bašta, Milan (vedoucí práce) ; Plašil, Miroslav (oponent) Neuronové sítě jsou jedním z nejvíce fascinujících algoritmů strojového učení. Mají za sebou však velmi bouřlivý vývoj. Neuronové sítě byly dlouho považovány za algoritmus, který je velmi nespolehlivý a výpočetně náročný. Dnes již víme, že moderní neuronové sítě mohou být úspěšně aplikovány v mnoha úlohách, i když jejich hlavní nevýhoda, tedy značná výpočetní náročnost, stále přetrvává. Statistické modely založené na technice boosting, jsou považovány za jednu z nejpřevratnějších myšlenek na poli algoritmů strojového učení. Tyto modely jsou založeny kombinaci několika slabých modelů, které pak dohromady tvoří jeden silný model. Tato práce se zabývá srovnáním těchto dvou modelů na třech reálných případových studiích. První případová studie se zabývá modelováním pravděpodobnosti loupeže v ulicích města Chicago, druhá případová studie je klasickým příkladem modelování pravděpodobnosti, že zákazník telekomunikační společnosti vypoví smlouvu a poslední případová studie je aplikací počítačového vidění. Cílem této práce je také představení open-source platformy pro strojové učení H2O. H2O obsahuje mimo jiné rozhraní pro R a dokáže běžet samostatně, nebo na Hadoop clusteru. Práce také obsahuje úvod do open-source softwarové knihovny pro zpracování velkých dat Apache Hadoop. Konkrétně do open-source distribuce Hortonworks Data Platform. Úplný záznam
	BigData řešení pro zpracování rozsáhlých dat ze síťových toků Melkes, Miloslav ; Ráb, Jaroslav (oponent) ; Ryšavý, Ondřej (vedoucí práce) Tato diplomová práce se zaměřuje na problematiku distribuovaného zpracování velkých dat ze síťové komunikace. Začíná analýzou síťové komunikace založené na modelu TCP/IP se zaměřením na datové jednotky na jednotlivých vrstvách, které je nutno při analýze síťových dat zpracovávat. Z hlediska vlastního zpracování rozsáhlých dat je objasněn výpočetní model MapReduce, architektura technologie Apache Hadoop a jejich možné využití pro zpracování síťových toků na clusteru počítačů. Druhá část práce se zbývá návrhem a následnou implementací aplikace pro zpracování síťových toků ze zachycené síťové komunikace. V této části jsou rozebrány klíčové a problematické části z implementace. Celá práce je poté zakončena srovnáním s dostupnými nástroji pro síťovou analýzu a vyhodnocením sady testů, které potvrdili lineární růst zrychlení. Úplný záznam
	Trendy v analytickém CRM Heřmanský, Michal ; Šperková, Lucie (vedoucí práce) ; Jašek, Pavel (oponent) Tato práce se zabývá hlavními trendy v oblasti analytického CRM. Cílem práce je tyto trendy identifikovat a porovnat s reálnou situací na trhu CRM. Práce je rozdělena do několika částí. V úvodu je popsána problematika Customer Relationship Managementu spolu s architekturou CRM systému. Dále je popsáno analytické CRM a jeho základní funkce. Jednotlivé trendy jsou přehledně charakterizovány a následně jsou v další části porovnány se současnou situací na trhu CRM. Přínosem této práce je shrnutí aktuálních trendů v oblasti analytického CRM a jejich porovnání se situací na reálném trhu CRM produktů. Úplný záznam
	Big Data in technologies from IBM Šoltýs, Matej ; Novotný, Ota (vedoucí práce) ; Hrabina, Pavel (oponent) Tato diplomová práce představuje Big Data technologie a jejich možné využití a uplatnění. Teoretická část práce je nejprve zaměřená na definování termínu Big Data. Dále se zaměřuje na technologie Big Data, konkrétně framework Hadoop. Popsané jsou principy Hadoop-u, jako je distribuované uložení a zpracovaní dat a postupně také jeho jednotlivé komponenty. Následně jsou představeni největší dodavatelé Big Data technologií. Případy možného využití Big Data technologií a několik případových studií je popsaných v závěru této časti diplomové práce. Praktická část práce popisuje realizovaný demonstrační příklad použití Big Data technologií a je rozdělená do dvou kapitol. První kapitola praktické části popisuje v konceptuální rovině návrh demonstračního přikladu, použité produkty a architekturu řešení. Na základě toho je v druhé kapitole popsaná realizace demonstračního přikladu, od přípravy prostředí až po vytváření jednotlivých aplikací. Výstupem této diplomové práce je popis a charakteristika Big Data, představení největších dodavatelů a jejich produkty na Big Data, popis možných případů využití Big Data technologií a hlavně realizace demonstračního přikladu v Big Data nástrojích od společnosti IBM. Úplný záznam
	Big data - použití v bankovní sféře Uřídil, Martin ; Slánský, David (vedoucí práce) ; Pour, Jan (oponent) Rostoucí objemy světových dat nabízejí nové možnosti pro ty účastníky trhu, kteří se je rozhodnou využít. Zvláště v odvětví bankovních služeb jsou data, informace a znalosti velmi ceněnou komoditou. Tradiční analytická řešení běžně pracují s daty, která mají předem definovanou strukturu a význam. Jak ale těžit informace z dat, která tuto vlastnost nesplňují? Práce se zaměřuje na využití Big Data analytiky v oblastech bankovnictví a finančních služeb. Cílem práce je definovat konkrétní aplikace trendu v tomto oboru a popsat jejich přínosy pro bankovní instituce ve světě a v České republice. Za účelem dosažení cíle je práce rozdělená na čtyři hlavní části. První část popisuje samotný trend Big Data, druhá část vymezuje činnosti a využívané nástroje v bankovním prostředí. Třetí stěžejní část pak na vymezené činnosti aplikuje Big Data analytiku a ukazuje její možné přínosy. Poslední část se soustředí přímo na specifika českého bankovnictví a odpovídá na otázku, jaké je aktuální využití Big Data v českých bankách. Práce podává komplexní obraz o možnostech využití analýz nad daty, která splňují specifika Big Data. Hlavní přínos vidím v aplikaci trendu v reálných činnostech banky, kde práce podrobně popisuje jednotlivé případy. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English